Common Voice微调

# Common Voice微调

Wav2vec2 Large Xlsr 53 Hungarian

基于facebook/wav2vec2-large-xlsr-53在匈牙利语Common Voice数据集上微调的自动语音识别模型

Transformers 其他

基于OpenAI Whisper Medium模型微调的乌兹别克语自动语音识别模型

Transformers 其他

Disper Small Salam

基于OpenAI Whisper-small微调的阿拉伯语语音识别模型

Transformers 阿拉伯语

Whisper Medium Cv11 German Ct2

基于OpenAI的whisper-medium模型在Common Voice 11.0德语数据集上微调的自动语音识别模型

Transformers 德语

基于Whisper Base微调的乌兹别克语语音识别模型，在Common Voice数据集上训练

Transformers 其他

Whisper Small Uzbek

基于OpenAI Whisper-small微调的乌兹别克语自动语音识别模型，在Common Voice 17.0数据集上训练

Transformers 其他

Whisper Large V3 Turbo Es

基于Whisper-large-v3-turbo微调的西班牙语语音识别模型，在Common Voice 17.0西班牙语数据集上词错误率降低至5.34%

Transformers 西班牙语

Whisper Tiny Chinese

基于OpenAI Whisper Tiny模型在Common Voice 11.0中文数据集上微调的语音识别模型

Transformers 中文

Whisper Large V3 Pt

基于OpenAI Whisper Large-V3模型，在葡萄牙语数据集上微调的语音识别模型

Transformers 其他

Whisper Large V3 Az

该模型是基于OpenAI的Whisper Large v3在阿塞拜疆语Common Voice 17.0数据集上微调的自动语音识别(ASR)模型，取得了1.195%的词错误率(WER)。

Transformers 其他

Whisper Large V3 Turkish Test1

基于OpenAI Whisper-large-v3模型在Common Voice 17.0土耳其语数据集上微调的语音识别模型

Transformers 其他

Whisper Tiny Ru

本模型是基于openai/whisper-tiny在Common Voice 14.0数据集上微调的俄语自动语音识别模型

Whisper Small Turkish V2

基于OpenAI Whisper-small模型在土耳其语Common Voice数据集上微调的语音识别模型

Transformers 其他

基于OpenAI Whisper-base模型在Common Voice 11.0俄语数据集上微调的语音识别模型

Transformers 其他

Speecht5 Finetuned Commonvoice Ru Translit

基于microsoft/speecht5_tts在Common Voice 13数据集上微调的俄语文本转语音模型

Transformers 其他

Speecht5 Finetuned Common Voice Be

基于Microsoft SpeechT5架构的白俄罗斯语文本转语音模型，在Common Voice数据集上微调

Transformers 其他

Speecht5 Tts Common Voice Uk

基于Microsoft SpeechT5架构微调的乌克兰语文本转语音模型，使用Common Voice数据集训练

Transformers 其他

Speecht5 Tts Common Voice 5 Sv

基于微软SpeechT5架构微调的瑞典语文本转语音模型，使用Common Voice数据集训练

Transformers 其他

Whisper Medium Turkish 2

基于OpenAI Whisper Medium微调的土耳其语语音识别模型，在Common Voice 11.0数据集上训练

Transformers 其他

Whisper Large V2 Hungarian

基于OpenAI Whisper Large-V2模型在匈牙利语Common Voice数据集上微调的语音识别模型

Transformers 其他

Whisper Large V2 Serbian

这是基于OpenAI Whisper Large-V2模型在塞尔维亚语Common Voice 11.0数据集上微调的语音识别模型，词错误率为10.76%。

Transformers 其他

Whisper Large V2 Hausa

该模型是基于OpenAI的Whisper Large-V2在豪萨语语音识别任务上微调的版本，在Common Voice 11.0数据集上训练

Transformers 其他

Whisper Large V2 Slovenian

本模型是基于OpenAI的Whisper Large-V2模型在Common Voice 11.0斯洛文尼亚语数据集上微调的语音识别模型，词错误率为13.83%。

Transformers 其他

Whisper Large V2 Hindi 2.5k Steps

这是一个基于OpenAI Whisper Large V2模型微调的印地语自动语音识别(ASR)模型，在Common Voice 11.0数据集上训练，词错误率(WER)为10.05%。

Transformers 其他

Whisper Large V2 Bn

基于OpenAI Whisper Large-v2模型在孟加拉语语音数据集上微调的自动语音识别(ASR)模型

Transformers 其他

Whisper Large V2 Ta

基于OpenAI Whisper Large-v2模型微调的泰米尔语自动语音识别(ASR)模型，在Common Voice 11.0泰米尔语测试集上达到8.45%的词错误率

Transformers 其他

Whisper Large V2 Malayalam

这是基于OpenAI Whisper Large V2模型在马拉雅拉姆语语音识别任务上的微调版本，使用Common Voice 11.0数据集训练

Transformers 其他

Whisper Large Pt Cv11

基于OpenAI的Whisper-large-v2模型在葡萄牙语Common Voice 11数据集上微调的语音识别模型

Transformers 其他

Whisper Large V2 Hi V3

基于OpenAI Whisper Large-v2模型微调的印地语语音识别模型，在Common Voice 11.0印地语测试集上达到11.3%的词错误率

Transformers 其他

Whisper Large V2 Punjabi

基于OpenAI Whisper-large-v2微调的旁遮普语自动语音识别模型，在Common Voice 11.0数据集上训练

Transformers 其他

Whisper Large V2 Vietnamese

该模型是基于OpenAI的Whisper Small架构，在Common Voice 11.0越南语数据集上微调的自动语音识别(ASR)模型

Transformers 其他

Whisper Large V2 Cantonese

基于OpenAI Whisper Large V2在粤语数据集上微调的自动语音识别模型，在测试集上达到6.7274%的字错误率

Transformers 其他

Whisper Medium French

基于openai/whisper-medium在common_voice_11_0数据集上微调的法语语音识别模型，标准化WER达到11.1406，优于原版模型。

Transformers 法语

Exp W2v2t Sv Se R Wav2vec2 S418

基于facebook/wav2vec2-large-robust模型微调的瑞典语自动语音识别模型，支持16kHz采样率语音输入。

Exp W2v2t Sv Se Vp Nl S842

这是一个基于facebook/wav2vec2-large-nl-voxpopuli模型微调的瑞典语自动语音识别模型，使用Common Voice 7.0 (sv-SE)数据集进行训练。

Exp W2v2t Fr Xls R S250

基于facebook/wav2vec2-xls-r-300m模型，使用Common Voice 7.0法语数据集微调的自动语音识别模型

Transformers 法语

Exp W2v2t Fr Vp Fr S438

基于facebook/wav2vec2-large-fr-voxpopuli模型微调的法语自动语音识别模型，使用Common Voice 7.0法语数据集训练。

Transformers 法语

Exp W2v2t Fr Unispeech S42

基于microsoft/unispeech-large-1500h-cv模型，使用Common Voice 7.0（法语）数据集微调的语音识别模型

Transformers 法语

Exp W2v2t It Vp Fr S821

基于facebook/wav2vec2-large-fr-voxpopuli模型微调的意大利语自动语音识别模型，使用Common Voice 7.0意大利语数据集训练

Transformers 其他

Exp W2v2t It Vp 100k S449

基于facebook/wav2vec2-large-100k-voxpopuli模型微调的意大利语自动语音识别模型，使用Common Voice 7.0意大利语数据集训练。

Transformers 其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24